블로그
카테고리 이동
![]()
[AI-SPARK 3편] 파이썬 오디오 감정 분석 전처리에 쓰이는 Spectrogram과 librosa
2022. 10. 11. 12:00
파이썬 에서 오디오 분석 을 하고자 한다면 웬만하면 오디오를 '스펙트로그램(Spectrogram)' 으로 전처리 를 해줘야 할 필요가 있다.
마치 우리가 쓰는 글에 대해서 컴퓨터는 2진법으로 바꿔야 알아들을 수 있는 것처럼
오디오 또한 오디오에 맞게 정보를 바꿔줘야 할 필요가 있는 것이다.
그렇다면 Spectrogram 은 무엇인가?
어려울 것 없다. 오디오의 정보를 X축 시간, Y축 주파수(frequency), Z축 진폭(Amplitude)에 맞게 바꿔주는 것 이다.
그러면 우리가 옛날 과학시간에서 자주 보던 그래프가 나오게 된다.
![]()
Spectrogram 예시
그렇다면 파이썬 혹은 머신러닝, 딥러 닝에서는 어떻게 오디오를 Spectrogram 으로 형태를 바꿔줄 수 있는가?
역시 친절하신 누군가가 해답을 만들어놓으셨다. 바로 라이브러리 'librosa' 를 이용하면 오디오 데이터를 쉽게 전처리 할 수 있다.
링크는 아래와 같다.
[Using display.specshow — librosa 0.10.0.dev0 documentation
0.10.0.dev0 Getting started Installation instructions Tutorial Troubleshooting API documentation Core IO and DSP Display Feature extraction Onset detection Beat and tempo Spectrogram decomposition Effects Temporal segmentation Sequential modeling Utilities Advanced topics Multi-channel Filters Cachi...
librosa.org
](https://librosa.org/doc/main/auto_examples/plot_display.html#sphx-glr-auto-examples-plot-display-py)
![]()
코드는?
Spectrogram 을 만들기 위한 함수를 하나 선언하면서 그 안에 librosa.stft 함수만 사용한다면 스펙트로그램 데이터 를 리턴해준다.
음성 데이터 전처리가 아주 쉬워졌다.
![]()
![]()
![]()
[비즈니스·경제 이웃 1,983 명
파이썬, 머신러닝, 딥러닝을 꾸준히 학습하고 활용하고 있습니다. 공학적 지식과 경제/금융에 관심이 많습니다.
](https://m.blog.naver.com/ansrl23)